学习的乐趣

原文:Pleasure of learning - supermemo.guru

教育的主要问题

教育的主要问题和这种想法有关:学习令人不快,而为了达成更多学习目标,学习者应忍受这种不快。

太多教育工作者认为,学校是不得不做的苦差事,正如工作一样。然而在本章中,我要说明,恰恰相反:

好的学习本质上是令人快乐的,没有快乐就没有好的学习。

「学习使人不悦」这一谬误太盛行了,就连不错的老师也认同,痛苦是学习的一部分。

在这一章中,我将指出学习的快乐是人类的本能,以及我们是如何系统地摧毁这种进化的馈赠的,以至牺牲人类的健康、学习、创造力和最终未来。

教育的主要问题也是社会的主要问题。如果破坏学习的乐趣,生活的乐趣也就被大大摧残。我们建立的教育系统,让数百万人过上了不幸福的一生。

你很可能对我的话持怀疑态度,因为「学习使人不悦」这一谬误正是学校教育的一个强效的副作用。因此,本章旨在说服您相信这个观点。而要破除这一谬误,就有必要了解新知识在大脑中编码的简单机制

学习内驱力和熵

熵的概念可以帮助你理解,为什么大多数孩子在学校里学不到什么东西。

你可能还记得物理课上曾讲过熵是无序程度的度量(译者:不记得,是贵乎教我的),且热力学第二定律表明,孤立系统的熵永远不会减少。这是令人终生难忘的迷人物理定律。它有广泛的适用性的。

在信息论中有一个熵的姊妹概念,叫做香农熵(Shannon entropy,信息熵)。它可以理解为一个信源所发送「信息」的平均值。例如有一个信道,如果它不断地发送相同的字母(比如,一串 A:「AAAAAA……」),它就是完全可预测的,因此统计下来其携带的信息熵为零。监听这样一个信道无法让你学到任何东西。

克劳德·香农(Claude Shannon)于 1948 年提出了信息熵的概念。不久之后,科学家们开始对「一个信道的熵,是否可能强烈影响大脑对其价值的感知」做出假设。1957 年,迈尔(Leonard B.Meyer)推测音乐的熵决定了人们感知其美。他的结论是,较高的熵可能会导致主观上的紧张,这与更有意义的音乐时刻相关(meaningful musical moments)。

迈尔后来改进了他的假说,以更好地建立对音乐一般信息感知的理解。但「音乐」既是信息,也不只是「信息」。这可以从一首歌因其娱乐性和趣味性而被回放数次的现象中看出,但「书籍」则很少出现这种反复看多次的情况。

音乐是一种普世信息。如果让你用旋钮调出一个无线电频道,你会很快避开嘈杂的只有静电噪声的频道,也不会对零熵的寂静频道感到太兴奋。然而,大多数人会对有规律的鼓点做出积极回应。只要不是在碎玻璃上敲击(我们天生不喜欢这个),我们就会认为,一个鼓点规律的广播频道比一个安静的频道更有趣。自然,这种有趣只会持续一段时间,直到鼓声本身变得乏味 —— 因为你已对其了如指掌。

如今,我们终于可以测试大脑对信息熵的响应了。神经成像显示,海马体前部对视觉流的熵有反应腹侧纹状体上也有类似的发现。因此现在,我们可以肯定大脑对信息熵有响应。在快速观察环境以寻找学习机会时,熵感知器非常重要。这是奖励的前奏,而奖励是学习内驱力的基础。

信息检索中的前置知识

我们需要区分「信息」与「意义」,熵不是后者的好度量。要度量意义,既需要度量信道,还必须有大脑本身参与。既有知识在学习中至关重要。想象一下,你在收音机上寻找有趣的频道时,找到了一个新闻服务。如果该服务是泰语的,而不会说泰语的你肯定更偏好母语版的新闻服务。在信息层面上,两种语言的新闻信息熵可能一样,但既有知识会让你偏向母语频道。对你来说,泰语频道传递的只是声音流,而母语频道传递的是概念流。如果不了解信息接收者的知识储备,信息熵很难告诉我们什么。我们无法确定信噪比。

每个听众都会有他或她自己特定的信息熵水平。对于大多数音乐爱好者来说,迪斯科或电子舞曲的规则节拍会比单一的鼓点节拍更有趣。这种类型的音乐平均信息量更高。更老练的听众会乐于接受多一点的切分音。然而,需要一定程度的预先学习才能听懂切分音。那些音乐知识较少的人可能会难以理解更复杂的节奏。如果节拍中的信息太多,或许就不再能够让人随着音乐跳舞。普通人可能很难体会 Wynton Marsalis 的天才之处。货架最上面摆放的爵士乐仅为一小部分受过高等教育的听众保留。对大多数人来说,随着复杂度的增加,音乐慢慢瓦解为电台的静电噪音。

大脑中的熵探测器

大脑不能有效地检测到达视网膜或鼓膜的信号的熵。就像显示器的像素一样,视网膜细胞并不知道它们显示的是什么。如果检测器,如海马体,要对熵作出响应,它必须对来自内嗅皮层的输入(即对海马体本身的输入)进行操作。这些输入将在高度处理之后呈现出信号。它可能会表示一个概念,而不是像素。从感官输入的高熵信号将在神经选择、补完和泛化过程的早期舍弃大部分噪声成分。舍弃多少信息由信噪比决定。噪音越大,舍弃越多。我们越聪明,这个过程就越有选择性,在该阶段舍弃的信息就越多。这很好。我们变得对细节视而不见。模式识别的作用类似于确定性函数,根据定义,它会导致熵下降。复杂的模式可能会变成简单的概念。这些概念将为检测器(例如海马体)提供实际的输入。

请注意,在实验中,为了证明海马对信号的熵的响应而制作的视觉流是高度符号化的。因此,这样的流在处理过程中被舍弃的信息要少得多。海马体扫描经过高度简化和概念化的消息以获取惊喜,并为整个学习内驱力系统提供指导。这就是为什么在这种情况下,海马体似乎对输入的熵有响应。

上述推理解释了为什么低熵和高熵的感官信号都可能不吸引人。高熵信号经过一定的处理,可能会失去全部噪声,成为低熵输入传递到海马体。于是,在感官信号方面,我们会观察到一种「最优熵」水平的幻觉。我们需要一个新的概念,学习熵,来帮助我们准确定义信号的吸引力。学习熵需要考虑信息在激活大脑的奖励中心之前所经历的高度加工。学习熵会在后文讨论。

处理信息的速度

研究者往往低估了大脑在扫描感官信息时的信息处理速度这一因素。

每一首音乐都有一个可接受的回放速度的范围,在此范围内人们可以欣赏到音乐之美。快速播放可能会令人烦躁,音乐可能会变得难以解码,因为这超出了我们的处理能力。而慢速播放可能会使音乐很快失去吸引力。演讲或课堂讲课也是同样的情况。相同的信息和相同的熵水平,对于不同人的信号吸引力可能差异巨大。总有一个最优传输速度,该速度取决于推动学习内驱力的所有其他因素,包括既有知识。因此,传输速度是高度个性化的。

我喜欢以 1.4 倍速听讲座。我以 1.3 倍速听较难懂的片段。但是,我从来不快速播放 Fareed Zakaria,而是细细品味这个节目的每一个细节。在课堂中听课的学生没有加速或减速按钮。即使是暂停按钮,就算有也很难按下,因为这可能会惹恼其他学生。

在学校,教师传授知识的速度往往超出学生的处理能力。这使得学生几乎什么也学不到,精神高度紧张。在高速列车的窗口,无暇欣赏风景。在麻省理工学院,他们称之为**「用消防水管喝水」**。

概率 vs. 知识

小概率事件携带的信息更多。平均信息决定熵。信息接收者的前置知识储备会影响对信道的信息熵的感知。

如果你碰巧在听电台新闻时,听到了这样一句:「Janet Jackson 生了一个孩子」,你的关注程度将取决于事件发生的概率。如果你不知道 Janet Jackson 是谁,那么这是一个很有可能发生的事件。如果大约每天都有 35 万女性生孩子,那这就算不上新闻,也不是什么新鲜或有趣的事情。在战争中,第一名士兵的死亡是新闻,但当死亡人数增加到数千人时,年轻的生命就变成了一个统计数字。

如果你碰巧认识 Janet Jackson 或者喜欢她的音乐,那么分娩的概率就会急剧下降到「一生只有一次」的水平(对于 Janet 来说)。这会让你产生兴趣。然而,如果你回忆起 Janet 是某出古代情景喜剧中的一个美丽女孩,那么她的分娩可能会被归到「不可能!」的类别。如果你意识到 Janet 已经 50 岁了,而且你知道更年期的存在,你可能马上会特别好奇她的情况。你的既有知识决定了你对这个信息的反应。信道本身没有最优熵水平,只有适合特定大脑的最优熵水平。此时,你可能已经明白,我们需要引入一个新的派生概念,我们在后文将之称为学习熵。学习熵定义了给定信道对给定大脑的吸引力。(注:学术共识更广泛的「语义信息论」里的术语是「模型熵」和「平均语义熵」,但它们与这里的「学习熵」在于没有去关心「吸引力」部分)

如果你喜欢 Janet 式的八卦,那么充斥着类似八卦的频道会为你提供合适的惊喜水平。两者达到了「学习熵匹配」。如果你缺乏必要知识或者优先级不同,你就会失去兴趣。你的学习优先级还将决定你在特定领域的知识水平,以及你对任何特定信道及其信息熵的反应。

可预测性与惊喜

概率和复杂性不是信息感知的唯二组成部分。我们似乎在可预测性和意外性之间寻找平衡点。我喜欢乡村爵士乐,在这种类型的音乐中,音符切分得恰到好处的低音旋律线通常是高度可预测的,这使得听众可以很容易地跟随节奏摇摆身体。然而,乡村爵士乐如果不带惊喜也就没什么意思了。复杂的爵士乐即兴演奏通过惊喜之处刺激负责检测惊喜的神经系统。此外,经过几十年的学习,我的大脑内部已经有了一个可产生响应的完整的信号数据库。或许我可以认出某个和声歌手的声音是我喜欢的。我的大脑已经做好了欣赏爵士乐的准备。

我喜欢 Ken Robinson 关于创造力的课程。在某种程度上,它们是高度可预测的。我完全同意 Robinson 的观点,所以你可以说 Robinson 助长了我的确认偏误。这是令人愉快的。当人们同意我们的观点时,我们喜欢说「英雄所见略同」。但如果 Robinson 只是不断重复关于「学校如何扼杀创造力」的陈词滥调,他将失去吸引力。熵可以解释为惊喜的平均期望。Robinson 的讲授带来了很多令人愉快的惊喜。他可能会以与众不同、别出心裁的创造性方式描述同样的模型。因此,大脑接收新信息,产生泛化,并确认现有模型。从新的上下文中形生的泛化增加了知识的连贯性。这是对已知模型的信息的补充,这可以使人非常愉快。

Robinson 的课程在可预测性和意外性之间找到了很好的平衡。

最令人愉快的信道将持续提供惊喜,证实现有的模型,并为之增加新的语义枝条,以便引入新的知识。意外地破坏现有模型可能一开始令人不愉快,但可能会导向令人非常愉快的思维进化。

打个比方说,你可以把这想象成信道在修整你的知识树,并添加新的分支,就像一个陶工在他完美塑造的作品中添加新的黏土层

探测信息量

人类的学习内驱力以探测信息量为基础。我们早就知道这一点了。人类学习和机器学习的所有模型都以不同的名称提及这个概念。Piaget 写道,在信息量的冲击下,认知图式陷入了失衡。Jeff Hawkins 在他的新皮质模型中谈到,学习和智力以奖励预测误差为基础。我喜欢讨论模型的细化(当新信息符合模型时)、矛盾(当新信息的引入导致模型需要更正时)和泛化(当遗忘记忆优化从模型中雕刻出新的性质时)。

为了获得学习的奖励,新的令人惊讶的信息需要符合已有的知识(模型、模式、预测等)。为了获得奖励,脑神经需要处理输入的信息,并将之与已存于大脑中的信息进行比较。大脑中处理输入信息的主要处理器之一是海马体。它是大脑的信息交换板,能够将输入的信息与已有知识进行比较。

视觉信息流中熵的高低不一定是信道令人愉悦程度的可靠指标。所有流向海马体的信息都经过了高度处理。代表美丽海滩的像素流将转化为一系列的形状和纹理。紧接着,这些转化结果将成为棕榈树、沙滩和海洋的模型。这种高度压缩的简单信息将决定对信息输入的原始响应。

审视环境中的信息相当于搜寻食物的气味。气味是诱人的,但是只有真正的进食是确切的奖励。这解释了为什么视觉扫描中的熵本身不必具备奖励性,因为这种熵扫描只需暗示它将会导向奖励即可。正如前文所述,海马体前部对熵作出响应,然而实验设计确保了其输入熵源于简单形状的组合,这在输入处理过程中不会丢失太多的信息。相比于信号熵,我们更应该关注信息比较器(比如海马体)的输入熵。重要的不是视网膜上的像素,而是要输入比较器的棕榈树的形状。对于比较器来说,视觉输入里由灰度或者静电噪音导致的高熵模式,与白色或静音这种低熵模式并无不同。它们在输入给海马体时都将具有相同的熵值:零。这就是为什么我要使用学习熵这一术语来精确表示信道的吸引力。

对信息熵作出反应的海马体前部因 Halle Berry 神经元的发现而闻名(参见更多)。通过将电极植入同意的癫痫患者体内,研究人员能够精确定位到在不同环境下对 Halle Berry 的图像做出一致反应的单个神经元。该神经元也会对 Halle Berry 的名字做出反应。同时,海马体后部对 Jennifer Aniston 的反应可能不太一致(可能暗示了前一层神经处理的痕迹)。

我们大多数人都不知道 Halle Berry 的气味,她的气味可能不够独特,不足以激活海马体中的 Halle Berry 神经元,然而,即使是气味信号也可以通过嗅球、嗅结节、梨状皮质和内嗅皮质中的少数几个突触快速到达那里(见图)。然而,如果一个人能听到 Halle 的声音,它可能会与嗅结节中的声音信号相遇,促进识别,最终激活海马体或更后方的新皮质中的 Halle 神经元。

Olfactory system anatomy

图:嗅觉系统解剖。气味信号可以通过嗅球、嗅结节、梨状皮质和内嗅皮质中的少数几个突触快速到达海马体。(来源:维基百科)

这是不是意味着 Halle 永久存在于病人的海马体里?由于海马体与新记忆的形成有关,我们可能更倾向于认为 Halle 出现在海马体神经元中是识别的结果。她在病人心中的永久位置很可能位于大脑新皮质下游更远的地方。我们现在知道,在巩固记忆的过程中,知识印记从海马体转移到新皮质。我们也非常确定这个过程发生在睡眠中。我们正是应该在大脑新皮质中,寻找代表 Halle 或代表病人祖母的概念神经元。最后一种可能性产生了一种假想类型的神经元,被称为**祖母细胞**。

在猴子身上,研究人员可以辨认出视觉皮层中对面孔做出反应的祖母细胞。我们可能会发现,与 Halle 的图像接触时,那里的细胞会更持续地兴奋起来。然而,Halle 的概念可能仍然存于其他神经元中,在视觉皮层的细胞注意到 Halle 之后,才会与其他祖母细胞一起被激活。

另一种激活途径可能来自于在新闻中听到 Halle 的名字。内嗅皮层和海马体会协调整个识别过程,并最终点亮存在于新皮质的某处的 Halle 神经元。

为了使富含信息的信号产生奖励,必须能够检测到输入中的小概率事件,并通过关联将其编码为皮层中的新知识。在海马体前部对熵作出反应的地方,拓展双边丘脑-皮层网络的活动将受到惊讶因子的调节。我们将在那里寻找学习的乐趣之源。根据消息的类型不同,这个过程还可能涉及其他比较中心。人们还发现,杏仁体在检测到新颖的视觉信号时也可能会产生奖励。对奖励性的视觉刺激做出反应的杏仁体神经元同样也可能对新颖的视觉刺激做出反应。Rolls 推测这可能会通过杏仁体实现新颖性的奖励

我们知道海马体与伏隔核(大脑的愉快中枢)直接相连。此连接可能用于两种情况:

1、对快乐的期待和

2、最后的奖励。

检测到高学习熵信号后,期待随之而来,并导致对高价值信息的主动追求。海马体检测到信息的同时,也将关联的学习信息发送到新大脑皮层,并把奖励信号发送到愉快中枢。那就是学习新东西的时刻!

「哇!」因子

1977 年夏天,SETI 研究者搜寻外星智慧生物时,发现了来自射手座的反常无线电信号。宇宙空间中,平时只有乏味的低水平噪音,这样的信号令人难以置信。低概率标志着高度惊讶。天文学家 Jerry Ehman 在打印出来的信号上圈出 6 个字母,并标上了「哇!」。(注:SETI 即 Search for ExtraTerrestrial Intelligence 的缩写。)

A scan of a color copy of the original computer printout, taken several years after the 1977 arrival of the Wow! signal

图:原始计算机打印输出的彩色扫描副本,拍摄于 1977 年哇!信号到来的几年之后。(来源:维基百科)

「哇!」是大脑对意外发现的反应。这一刻令人非常愉快。学习内驱力的唯一目的就是寻找环境中的「哇!」因子。它们是最有价值的知识金矿,它们补充了目前已知的:当前的现实模型。渐进阅读的乐趣来自于密集地涌入学生大脑的「哇!」的力量。

至此,我们历数了熵、惊喜、可预测性和现有知识对学习的影响。在这个案例中,仅凭信号的概率并不能完全解释其威力,这要靠作为支撑的阐释(见:知识估值网络)。在做笔记的那一刻,Ehman 就已感觉到其影响的深远。这是迄今为止最有力的证据,证明了人类智能以外的其他智能的存在。如果同样的信号代表了在海洋中探测到沙丁鱼,就不会有「哇!」的感叹,即使在北极也不行。

信道的可靠性很重要。如果错误率较高,学习内驱力可能会被削弱。当彭齐亚斯和威尔逊在 1964 年发现宇宙微波背景辐射时,没有人惊叹。困惑的研究人员继续从他们的无线电天线上清除鸽子粪便。在解释这种神秘的噪音时,鸽子粪便被优先考虑。1978 年,彭齐亚斯和威尔逊因他们的发现获得了诺贝尔奖。

当科学家有新发现时,他可能会大叫**「尤里卡! 」**,向空中挥拳。他大脑某处的神经网络产生了一个泛化,由此发出奖励信号。经过进一步传播,这会让一个老人像个孩子一样在实验室里跳来跳去。

同样的事情也会发生在生命早期。在空荡荡的房间里,蹒跚学步的孩子会扫视环境,寻找五颜六色的物体、新玩具等低概率的成分。当蹒跚学步的孩子尝试把勺子丢下桌子时,她就像一个小科学家。不过,当大脑产生**「所有掉落的勺子都会发出噪音 」**的泛化时,她也会得到奖励。她可能会以与快乐的科学家完全相同的方式庆祝,尽管年龄相差甚远。灿烂的笑容是第一个清晰的信号。

同样的乐事在学习内驱力控制的所有形式的学习中都会发生,虽然程度相对低一些。不论我们了解的是关于一位名人还是一块岩石的化学成分,全都没有差别。事情有趣,是因为它们全都通过学习内驱力的机制奖励大脑。

创造性过程也会产生奖励。一个被认为有用的联想是有价值的。能够解决难题的联想会更有意义。显然,奖励是有分级的。系统可以量化信息、关联或解决方案的概率:概率越低,奖励越高。

知识估值网络

知识估值

大脑处理所有粒度的知识碎片时,都会立即评估它们的相关性、连贯性和价值。我们立即知道信息是否可理解,是否有用。当信息不一致不连贯或不相关时,我们通常也会立即察觉。

不同寻常、令人惊讶的知识价值很高,但是,从大脑的角度来看,概率并不是价值最好的反映。有些低概率事件并不重要(例如,遥远行星系统中的小行星撞击),而另一些概率很高的事件则会改变一个人生活(例如,**「你愿意嫁给我吗? 」**的答案)。

知识估值主要依赖知识对于实现个人目标的适用性

情绪脑和理性脑

知识估值网络是基于对知识在情绪和理性两方面的评估结果而形成的评价体系。在文献中,它又被广泛地称为神经估值电路(neural valuation circuitry),它不一定只基于特定知识。

在估值网络中,情绪估值会把信息与负责饥饿、口渴、性欲等的原始大脑中枢的奖励联系起来。理性估值则以知识为基础。如何回答**「最近的快餐店在哪里? 」**,就是一例纯粹情绪估值。基于知识的估值会更加复杂,高度网络化,即依赖于次级估值网络。要回答「哪本书最适合我的考试?」,就得基于个人目标来评估,这些目标包括通过考试、获得学位、就业前景,以及人生目标。情绪估值和理性估值在生理上相互隔离。情绪估值来自被比喻为三重脑的较原始部分:爬行动物和古哺乳动物的结构。例如,特定刺激被丘脑处理后,可能会向杏仁体发送单独的信号以进行情绪估值,并向新皮质发送信号以进行理性估值。情绪脑在遗传学上更古老。个性和教育决定了理性估值能否控制或推翻情绪估值。

快速思考中的决策树

知识估值网络是确定单个知识价值的记忆连接网络。如果将学习视为一种任务,那么估值网络将确定感知上的任务价值(参见:问题估值网络)。

用计算术语来说,知识估值网络可以比作决策树。目标和情绪决定了根节点的核心价值。知识之间的语义连接可以看作从目标到细节的细微价值传递。精心选择并巩固的知识所构成的组织良好的语义网络几毫秒之间就能做出专业决策。这就是卡尼曼(译注:《思考:快与慢》作者)所说的自动快速思考(如果对需要放慢速度解决的难题感兴趣,请参阅《如何解决任何问题?》)。作为决策或解决问题之基础的这种处理过程,也参与了知识估值。像许多专业决策一样,估值十分迅速,且几乎不需要刻意关注。简而言之,我们有时死都想知道一些事情,却完全无法解释为什么。这个过程几乎不受我们自己控制,更不受学校老师的控制。为了高效学习,估值必须很高。

Xefer is a tool that helps understand knowledge as a network. It relies on semantic links between Wikipedia articles

图:Xefer.com 是帮助理解作为网络的知识的工具。它依赖于维基百科页面之间的语义链接。

教育中的估值网络

大脑在多年的学习过程中建立了估值网络。通过睡眠中的优化遗忘,估值网络经过打磨、抛光,为高效运行做好了准备。这使得估值捷径易于穿梭。正在挑选课本的学生,不再从整个人生的情境去看待这场考试。他更可能建立了如下捷径:「接下来的三个月,我只想通过地理考试」。

知识估值网络往往高度个人化,因人而异。例如,对于理性和情感的平衡点会有不同,不同目标之间的权衡也会有不同。罪犯会形成异于常人的估值网络,而一个立志为人类谋福祉的研究员,自然也有别致的估值网络。

估值网络的发展和个人秉性、人生履历、成长环境息息相关。童年的创伤或人格特征,如易冲动,更有可能培植出罪犯心态。早年生活一些创伤事件可能会促进一意痴迷的估值网络的发展(参见:错误向量)。环境和可用的知识将决定激情、兴趣、目标和次级估值网络(参见:概念化)。

理想中,发展出健康的估值网络需要免受创伤和慢性压力的童年——没有太大压力影响情绪估值,多玩,在超大行为空间中大量自由学习

所有促进大脑健康的策略也会使估值网络变得丰富、高效、高度个性化。这些要素将构成出色的学习内驱力的基础。所有教育工作者都认可这样的目标:想要帮助孩子们很好地把握他们的情感生活,逐步培养聪明、有创造力且知识渊博的大脑。

教育系统的主要问题是一刀切,让所有孩子如上了流水线一般获得相同知识,而几乎不关心有效学习的重要组成部分:学习内驱力。学习内驱力是一种完美计算方法,它把表征大脑中知识的语义网络]的当前状态与来自知识估值网络的实时输入相匹配,这种输入主要来自对于环境中可用信息的响应。如果孩子坚持要看 YouTube 视频,那么他的大脑才是最大权威。所有干扰都将影响未来的独立性和创造力

与其让一名授课老师花 45 分钟给一个孩子灌输一长串低估值的符号,且效同水过鸭背,还不如让他上上谷歌,只需花上 3-5 分钟就可以找到高估值且易于记忆的信息,终生不忘(反例请见:数码痴呆症的病态迷思)。如果孩子对此轻车熟路,那么他通过自学,获取知识的效率将提高一个数量级。这里的「提高一个数量级」,是我谨慎而保守的判断,我可不想被人说在夸大其词。我在这篇文章的其他地方举了一些具体对比的例子(比如一个月上完 13 年学假期中学习速度加快 1600%)。

我称这种能力为知识金块,Peter Thiel 称之为幂律:一套至臻完美的核心技能能带来乘方级的生产力提升。

在学习上下点功夫就可以给个人生活和整个地球带来翻天覆地的变化

大脑中的知识估值

在解剖学中,对理解人类的思维至关重要的,是关于大脑的知识估值网络的实际实现的研究。这对预防抑郁和成瘾很有必要。知识估值是高效学习,创造力和解决问题的基础。

好的学习令人愉悦。食物、性或者毒品带来的快乐容易饱和,而愉快的学习则不会。我们可以轻易避免不愉快的学习。正是学习内驱力的存在,使我们天然可以做到这点。这就是学习对于人们快乐与否至关重要的原因。它可以实质性地为全社会的幸福感带来质的飞跃。

眶额皮质(OFC)

知识估值的网络性质表明了大脑皮质资源的使用状况。事实上,大多数研究人员似乎倾向于认为:整个估值系统可能以眶额皮质(OFC)为中心,越靠近其前部区域则抽象程度越高。关于单个子系统如何影响估值,已有很多模型和假设(如共同通货、共同尺度、躯体标记、按内容评价、多组分、认知-动机界面、平行评价、定位主义与建构主义模型等)。在共同通货模型中,来自所有子系统(享乐基底)的所有估值都被整合在一起,并提供「想要」或「喜欢」的最终信号。例如,(1)来自内侧 OFC(mOFC)的基于知识的估值可能会与(2)来自伏隔核(NA)的奖励预期以及(3)来自脑岛的食物评估信息结合起来,共同影响你选择下一顿饭去哪吃。

共同通货模型

OFC 是一个很棒的研究领域,因为人们感兴趣的很多主题汇集于此:毒瘾、快感缺失、习得性无助、强迫症等等。共同通货模型似乎表明,创造力爆发或学习内驱力爆发产生的快感,在神经化学和神经解剖学上与低剂量可卡因产生的快感相似。

所有的奖励是都会被转化为同一种奖励信号汇集到同一类神经元上,还是会分别保留它们的本源特征,这一点存在着激烈的争论。但我认为没必要纠结这一点,因为特异性由个体的概念图激活赋予,而共同通货则由单一输出产生的最终估值构成。在所有估值中,由于每个概念图激活都有其单一响应,因此我们需要收敛。一些 OFC 神经元似乎专门对高阶价值进行编码。

知识估值和决策中,我们需要独断。冗余可以用于恢复估值系统,但必须服从概念神经元的决策。同时存在两个拍板定案的,并不现实,好比某人一边吃饭,一边拿叉子刺自己眼睛,极为荒谬。尽管理论上相互竞争的神经力量可能导致这种场景,但这通常是由于计算错误。

知识估值的涌现

可以通过各个概念图之间的交互来构建估值网络。例如,如果考试这个概念是根据工作前景这个概念来估值的,这两者就可以被共同激活:找工作这个概念的估值会给考试相关的概念图一个估值。概念图激活的程度与相关概念估值共同决定了最后的评估结果。在导向腹侧纹状体的路径中,髓磷脂浓度会升高。这一点可能是为什么学习内驱力可以通过学习来增强(或者被学校的强迫学习所压制)的原因之一。OFC 在决定估值的过程中扮演的角色,与海马体在建立长期记忆的过程中扮演的角色类似。这些在大脑皮层中高度关连的区域扮演了交换机的角色(将相关区域连接起来),而不是“媒人”的角色。相对地,已连接的概念图或概念中心会自行发展它们之间的快速连接线路(比如在睡眠中)。通过新的线路,高价值的概念可以直接影响愉快中枢而无需 OFC 的干预。这样一来,只需通过单独激活某些概念细胞(例如,与某人最喜欢的演员相关联的细胞),便可以直接产生令人愉悦的估值。

逆向学习的危害

在不良的学校状况中,我们可能会将无关的上下文(例如 SuperMemo问答卡片的颜色)与低估值相关联。在这种情况下,白色问答卡片的概念或者问答卡片和颜色的概念的共同激活,都属于强烈的负面输入,会抑制估值。从表面上看,这似乎是一个阻碍估值的中止信号(可能在 OFC 侧面)。在这样的情境中,概念之间仍然可能建立关联,仍有可能做到短期的提取,然而,较低的估值将阻止记忆的巩固(例如,通过阻止向长期皮层存储的转移)(参见:How School Turns Off memory)。在逆向学习中,也可能会发生奖励的再编码过程(例如,改变 SuperMemo 中的模板颜色)。我们知道,OFC 受损的动物的逆向学习能力会被削弱(Mishkin 1972),这一点佐证了最高估值网络的解剖学位置。如果我们继续否决估值信号,最后可能会导致网络之间的竞争。在我的假设中,这一点是学校诱发的习得性无助的起源。学校胁迫是一种永久的逆向学习形式,它会慢慢消磨网络的可塑性,导致在决策过程中评估奖励的能力受到长期的不利影响。从这个角度来看,人类的记忆可以被看作是擦写循环次数有限的 EPROM。如果把长期学习视为突触基底的积累——该基底会在随后的稳定化过程中被删减(这反过来会减少突触发生)——逆向学习可能会使该系统不再响应:在这个系统中,学习不再可能。

无休止的虚假奖励和轻微处分可能会使知识估值过程关闭,并损害在学校的长期学习。

目标 vs. 习惯

知识估值网络是良好的自由学习的核心。相比之下,被动学校教育将导致习得性无助。人们可能一开始自然而然主动追求某些目标,然而强迫教育会使人变得习惯被动(反过来,在追求目标中摸爬滚打,则会收获健康的习惯)。系统中估值较低(没怎么激活兴趣概念图)的部分会抑制知识估值网络的输出。如此,学习时,大脑自然兴致不高。一旦学习内驱力枯竭,好奇心消亡,生活就变成了干巴巴地执行一连串缺乏奖励的习惯(参见:学校带来的 50 个坏习惯)。

若学习无乐趣,则人类的存在会退化成一套沉闷无趣的习惯。

知识估值:贯穿你的一生

个人轶事:为什么使用轶事?

我的学校试图剥夺我生命中最美好的东西

关于估值网络的力量和教育系统的对峙,我自己的经历就是显著的例子:

1985 年,我推导出了一个近似函数,用来计算使知识形成长期记忆所需的最佳复习间隔。这就是间隔重复的诞生。最初,该函数适用于纸笔版 SuperMemo。随后几个月内,我意识到这个系统非常强大。只要一台电脑,我就能让它功效翻倍。然而,我不认识任何可以根据我的数学计算编写学习软件的人。那个年代,波兰的整个程序员圈子里,要么是在大型主机上运行 Fortran 或 Cobol 的老古董,要么就是不断增加的业余爱好者们,他们主要摆弄微型计算机(如 ZX81、Commodore 64 或 ZX Spectrum)。于是,我决定亲力亲为。不过,我还没有掌握编程技能。作为一名计算机科学专业的学生,我选择向老师寻求帮助。然而,我们唯一的编程课程是 Datapoint 汇编语言。这些技能对于处理寄存器实现类似 11*11=121 的计算非常有用。这不是我想要的,我想学习一些对编写 SuperMemo 程序更有用的东西。我的学校一直要求我学习如何计算电子电路的电阻,或者符号积分。我的知识估值网络的输出很简单:编程技能将通向 SuperMemo 的诞生,而这将通向更快的学习(在所有领域,包括电子学或微积分)。我决心要学习编程,而我的学校决心阻止我(通过其他必修课使我不堪重负)。无奈之下,我报名入学了波兹南经济大学(University of Economics in Poznan),去学习那里的一门算法语言课程。该课程主要使用 Pascal。我不得不在学习平时的课业之余钻研 Pascal。那门课很不错,但我们学的都是理论,在纸面上完成。在当时(1986 年),整个波兰的大学里,个人电脑(PC)很罕见,大多数实际应用程序都运行在名为 Odra 的大型机上(1960 年波兰为苏联阵营所生产)。当我终于有了我的第一台计算机时:ZX Spectrum(1986 年 1 月 4 日),我终于可以真正开始学习在计算机上编程了。在我的电脑到来之前,我开始写我的第一个程序。我把它写在纸上!这是一个组织我日常活动的程序(有点类似 SuperMemo 中的 Plan)。不久之后,我也学会了 Pascal。首先,我必须降低学校的负面影响,减轻课业负担。我和我的电子电路老师达成了一项协议:我会为他做一些高通滤波计算,这将是一个提高我的 Pascal 技能的机会。这个程序花了好久才写完,极其浪费时间。这是一个糟糕的学习的完美案例。我几乎不明白我自己的程序是如何运作的。然而,这仍然比仅仅学习示意图的效果要好。就我的编程技能而言,那次学习很不错,我进步了很多。

很难向不懂编程的人说明白,但学习大学课程和自己动手编程的知识估值的差异判若云泥。在我的同学深陷乏味的电子学和计量学讲座的折磨之时,我开始了自己的编程之旅。在学校,我什么也学不到。在 Pascal 业余课程中,我学到一点。然而,只有以激情和明确目标为后盾的实践性知识至关紧要。到 1987 年 12 月,我的努力最终导向了 SuperMemo 的第一个版本的诞生,这彻底改变了我的人生进程。多亏了我的导师 Zbigniew Kierzowski 博士的开明,让我得以将我的硕士论文完全专注于研究 SuperMemo 这个主题。Kierzowski 教授,80岁生日快乐!对于一个学生来说,有这么大程度的自主决定权是相当不寻常的,更不用说论文还是用英语写的(不到十年后,波兰议会试图将这种行为定为非法)。这关系到 1989 年的大规模行政和策略斗争。

我如今最主要的快乐源泉是 SuperMemo,但我的学校教育几乎毁灭了它。但这不是因为有人怀抱恶意。我的大多数大学老师都很了不起。罪魁祸首是学校这个系统迫使学生学习死板的规定课程。给予学生创造性表达的空间,才是教育最好的基础。

我的学校乐此不疲地阻挠我完成对我来说最重要的事,而这件事却是我职业生涯和未来一切的支撑。要是我更顺从一点,更传统一些,更容易屈从于社会压力,我就会成为一个「更好 」的学生,在电子电路理论、微积分、计量学和抽象代数上投入更多时间。若果真如此,这篇文章就不会问世。这个网站 也不会存在。

我现在的生活是任何研究性的或业界内的职位都换不来的。基于我坚固的知识估值网络,任何对我的否定都无法打倒我。

我们要设计的教育体系,是让每个孩子都能自由发展的教育体系

学习熵

有很多因素会影响大脑对信息与信息渠道的感知和评估。在之前的章节中,我们注意到大脑不只对熵有响应。有很多因素会调节熵的影响或单个信息的意外性,包括:编码、传送速度、预处理(比如泛化、补全、辨认等等)、已有的知识(包括估值、情感价值、信道可靠性等等)、最佳水平(受处理速度影响)等等。

这一过程十分复杂,需要引入更恰当的概念以涵盖这些微妙之处。我建议使用「学习熵」这一术语来描述特定场景下某个教育渠道或者信号对某个人的吸引力。

学习熵指由学习内驱力系统所决定的某个教育性信号的吸引力。

有的课程很无聊,有的则让人目不转睛。学习熵从个人的角度描述各个课程的吸引力。

熵有精确的数学定义,但学习熵并非如此。其最佳衡量方式应该是,对经过分析的信号进行学习之后,个人的奖励系统所作出的响应。就像熵依赖于信息的概率一样,学习熵依赖于信息(图片、声音、语句等等)的回报能力。其回报能力与概率有关,但是具体估值主要依赖于知识估值网络

好的学习是有奖励的。但也有糟糕的学习。存在解码失败惩罚:如果学生努力理解一条信息但失败了,他会受到惩罚。这会带来挫折感,是厌恶学习的开始。如果学习熵低,奖励少,惩罚高,净结果可能是负的。如果我们将负面奖励信号算在内,学习熵实际上可能会是负值。一堂枯燥的讲座可能带有负学习熵,导致学习内驱力被抑制。

知识估值较高,则学习熵也较高。这对于使人专注于知识的语义插入以实现长期记忆是必要的。学习熵提升学习内驱力,进而提升估值,估值反过来决定学习熵,构成强大的反馈循环。遗忘、习得性无助、衰老、受伤、脑力的可用性均会控制这个循环的强度。只要理性学习、良好生活,特别是要尊重自然创造力周期,这个循环可在学习内驱力较高的平衡状态下保持数十年。

信号时机 vs. 学习熵

学习流中单个信息的奖励水平决定了信号学习熵的高低。一个主题枯燥的讲座的学习熵较低。上网寻找解决特定问题所需的零星信息这种行为学习熵较高。

与基于平均值的香农熵不同,学习熵主要基于一种拖尾平均值:近期的消息比之前的消息具有更高的权重。此外,学习熵根植于控制记忆巩固的规则,包括间隔效应

只要有知识金块填补了理解上的重大空白,一堂枯燥的讲座的学习熵就会瞬间提升。学习熵的增加与决定知识估值的记忆轨迹的稳定性的表达式成正比(包括知识估值网络中的下降曲线)。知识金块的影响会逐渐减弱。那些可以为你带来快乐的发现累积起来,将决定任一时刻的学习熵水平(例如,在讲座期间的)。

上述内容表明,教育者可以影响学习熵,增强学习内驱力,提高长期学习效果。消极灌输知识的效果很糟糕。不必全部问题都提供答案,而应侧重于重要的抽象且普遍的问题。自我导向学习的自由探索是可以使人保持终身可持续的学习内驱力和终身学习的最佳模式。

所有形式的学校教育都会抑制学习内驱力。因此,许多成年人很难内化「学习熵在学习中的重要性」这一信息。然而,现代社会中,几乎每个人都会面临独自解决小的技术或健康问题的需要。有时问题可能很简单,比如对 Facebook 的选项设置进行小改动。越难找到一个问题的解决方法,找到答案的回报就越大。越难找到答案,搜寻和探索就越持久越广泛。每个人都应该熟悉这些感觉。然而,学习内驱力被抑制总是会导致收获的知识更少,自尊更低,所有的探索更早结束。换而言之,那些在学校或之后的生活中失去了创造内驱力的人,会更早放弃,甚至永远不去尝试。从这个意义上说,计算机、互联网、技术等带来的所有技术问题和小故障都有一些积极的副作用:刺激人们丧失的学习内驱力的最后一点残存,即使在最被动的人身上也是如此。唯一的必要条件是,这些探索需要以一定程度的成功结束。否则,可能会发生相反的情况:惩罚信号使人退出探索。

你可以快速回答关于你自己的学习内驱力的这个即时测验:如果你在生活中遇到一个小问题,你会去问人类专家还是谷歌?如果你的汽车失灵或电脑死机,或是你受伤了或肚子疼,你会怎么办呢?

学习熵与学习内驱力

学习熵奖励的影响会随着时间的推移呈指数下降,这个过程类似于遗忘。就像在间隔重复的复习中一样,新的奖励能把学习熵带回到更高的水平。就像在间隔效应中一样,同样的消息在间隔更长时,会更有价值。

在学习中,决定学习熵的奖励信号和决定记忆的巩固信号有一个很大的差别:一旦你学到了什么,在短时间内重复复习是没有用的。只要你完全记住了,就可以过一段时间再进行下一次复习。学习熵几乎没有上限。如果你喜欢一堂课,只要为之添加一些事实或表述的变换,你就可能更喜欢它。你一旦记住了什么,就不可能在短时间内再使用一些技巧去增强记忆。你可以使用助记术重组记忆并提高其持久度,但是一旦完全记住之后,保持长期记忆最好的做法是暂时不再用它,或是将之运用在不同的上下文中——这本质上是构建新的记忆,形成与原始单一记忆的冗余连接。

学习熵因缺乏奖励信号而衰竭。学习内驱力的消亡是一个遗忘问题(包括脑细胞丢失导致的遗忘)。

各个信息的奖励指数级下降和递减,学习熵随之累加。通过优化奖励信息的时机,我们可以提高学习熵,使学习成为与食物、性爱、毒品等奖励同等的最令人愉快的活动之一。如果你持怀疑态度,可以回忆一下:沉迷电子游戏的玩家可以忍饥挨饿玩一整晚游戏。电子游戏会劫持学习内驱力,将之与赌博的奖励相结合。赌博的奖励可能像学习熵一样,也受到类似的衰减/增强规则的支配。然而,它们还受到可变奖励的影响,这可能会导致上瘾。重要的是辨别学习的乐趣和有害的成瘾(见:学习成瘾)。

学习熵决定学习内驱力,但维持两者的规则不同。学习内驱力依赖于知识,因此将受制于间隔重复。因为知识以网络形式存在,故而谈论激励学习内驱力的最佳方式是没有意义的。为了最大化学习内驱力,我们应该进行终身学习,尊重自然创造力周期,并照顾大脑健康(即总体健康)。

最优信息传授

在学校教育中,我们可能设想课堂的学习熵都是最优水平,让学生能不停地赞叹喝彩,马不停蹄地记笔记。但更常见的情况是,课堂很无聊或是熵信号很高,但学习熵很低,甚至是负的。

既然最优学习熵与学生有关,老师怎么能做到向教室里的所有学生都最优地传授知识呢?这样全面地传授知识,有时几乎毫无可能,且至少也需要天才教师才能实现。大部分老师的课堂上,大部分学生不是无聊得昏昏欲睡,就是丝毫不懂抓耳挠腮。

只有少数幸运儿能通过听课学到大部分知识。对很少一部分有天分的孩子来说,老师的授课可能完全讲不出新东西,非常无聊。而对于其他孩子来说,授课内容则可能过于复杂,超出了他们的理解能力。这种情况下,他们如果勉强去理解,则可能遭受巨大的挫折。一堂关于弦论的课程,可能就跟随机打乱的一段中文一样难以理解。于是乎,听课不过是浪费时间。诺贝尔奖获得者 Carl Wieman 将课堂比作放血

为了避免负学习熵带来的挫败感,学生们会无视授课内容,就像对待我之前提到的泰语频道一样。孩子们会忽略来自老师的“静电噪音”,转向其他更适合其学习熵水平的频道(例如,桌下手机上的 facebook)。即使他们的理解力很好,老师的授课也可能并不能对他们的现有知识作出补充。如果不能生成高质量高价值的泛化,授课内容将被认为是显而易见或无关紧要的。

即使低学习熵只是偶尔发生的情况,也会使学生不再关注授课内容。过一段时间,学生们就会发展出一套过滤系统,把老师变成一个承载零熵、零学习熵的无声广播频道。再怎么提高授课质量只是徒劳——老师已经消失了!

在课堂环境中,学生通常不能将注意力集中在更好的信号上。所有的学生都会收到同样的信号,他们可能会感到同样的无聊。相比之下,在谷歌上搜索好的关键词,大脑会在恰到好处的低概率信息流中应接不暇,这些信息像拼图一样适合当前的知识树。谷歌是一个非常便宜且高效的「WOW!」生成器。

渐进学习中,大脑的学习熵扫描仪将挑选那些最好的频道,对其进行优先级排序,并采用完美的时机来最大化语义连接和记忆巩固。于是乎,为什么「我非常高兴我永远再不会被迫坐在学校的课桌旁!」是很容易理解的。我太喜欢学习了!

上面所有的例子都说明了,在识别什么值得学习时,信号和大脑之间的相互作用是多么错综复杂。学习的奖励是衡量学习质量的最广为人知的指标。当学生们高兴时,我们就是在正确的道路上。当学校给学生带来痛苦时,我们整个社会就是失败的。

知识的互补性和连贯性的唯一可靠指标是学习内驱力系统的神经网络。这就是知识不能预先打包并强加给学生的原因。

结晶隐喻解释了这一点。奖励系统的神经细节在学习奖励这一节阐释。

扣人心弦的授课

我们热爱学习,但我们通常厌恶别人教我们。这些感觉与创造力相关,这或许可以这样解释:创造性的阐述对于作为理解基础的模式补全是必不可少的。

在学习中,我们决定调查的内容。学习熵严格依照大脑的状态和当前的记忆激活进行评估。在教学中,知识是批量传授的,与我们的想法无关。许多学生认为他们不喜欢学校的首要原因是枯燥的科目——而不是校园霸凌、压力或强制早起。无聊令人痛苦!点击这里阅读我写的关于自我导向学习和在校学习之间的天差地别。一切都与学习内驱力有关!

我很惊讶有那么多的资源被浪费在「寻找使孩子们在授课过程中保持兴趣的方法」的研究上。而很明显,上课只是一个糟糕的教育工具。眼神接触分析?参与性分析?努力量化激情?所有的孩子都天生具有学习内驱力,我们的首要任务应该是确保我们不会破坏这一动力。强行灌输知识学习内驱力的主要破坏者。此外,还有许多社会经济学因素阻碍了很大一部分孩子,使之即使在最好的环境中也无法茁壮成长。有些孩子永远不会对学习产生热情。在大多数情况下,这不是他们的错。只有一小部分人受到残疾、健康和不太幸运的遗传禀赋的限制。学习内驱力]随着年龄的增长呈指数下降,主要是由强制学校教育引起的。被动听讲极大地推进了这一过程。

当然,也有些授课奏效了。可汗学院充满了好例子。即使是没有幻灯片讲义的纯口头授课也能奏效。YouTube 上的 TED 演讲可以很有趣。它可以满足学习内驱力慕课建立在这样一个原则上:一个摇滚明星教师比重复同样咒语的成千上万的普通教师要好得多。即使你只是一个被动的听众,你也能学到很多东西。不过,必须满足这样一些条件:你需要对这个主题抱有强烈的好奇心,或者你需要热爱演讲者,或者两者兼而有之。**只有一种有效机制可以确保讲座有趣:你要自主选择它!**这只是自我导向学习的又一必要条件。

除了自主选择之外,在听课时,你肯定需要一个暂停按钮,以防需要上厕所,或需要吃点东西安抚饥饿的胃。没有什么能像憋到要爆的膀胱那样有效地摧毁一堂课。最后但同样重要的是,大多数课程加一个 Netflix 的跳过片头功能都大有好处。

当然,最好用你自己的创造性思维或快速研究来增强听课的效果。暂停一分钟或一天,或许对学习效率至关重要。与一些心理医生的说法相反,创造性停顿和走神与 ADHD 无关,反而是很棒的学习的标志。

我使用两种方法渐进吸收授课内容。第一个方法是听讲和练习。练习能提高专注度。专注度高有助于减少停顿的需要,但是它也会减少学习的创造性。对于优先级最高的主题,我使用渐进视频,其中我可以多次暂停和继续播放。我甚至可以保留最重要的授课片段,以备将来复习。然而,渐进视频并不是最好的学习方法。它在速度和容量上无法与渐进阅读相媲美。有时,使用渐进阅读和阅读课堂讲义比听课本身更有价值。这一点在事实丰富的课程中尤为明显。

我主要根据我对讲授者的喜好来选择我的视频材料。在本文的情境中,我知道你一定会喜欢 Ken Robinson 的演讲!推荐去看:Robinson:学校扼杀了创造力

学习的奖励

学习的乐趣或许是最令人满意的乐趣之一。与进食或做爱相反,学习的乐趣不会随着行为的结束而终止。学习的乐趣是可持续的,只有学习过程中涉及的网络过载时,这种乐趣才会缓慢减弱。而且,通过睡眠就可以将其恢复到基准线。已被证明,学习与海洛因或可卡因给人带来愉悦的机制相同。与进食或性爱不同,愉快的学习可以占据大部分的清醒时间。从这个意义上说,学习、创造、解决问题和生产力带给人的乐趣可能是斯多葛式享乐疗法的伟大工具。健康的人很容易满足对食物的需求,但人对学习的需求可能永远不会终结。学习内驱力取决于当前已有知识的状态,此状态可以通过学习行为本身进行改变。

所有情绪容易波动的人都应该考虑以学习作为疗法

学习内驱力的奖励

我已经提到了几个例子,说明学习内驱力在大脑中产生奖励信号的方式。我们知道低概率信息可以带来奖励,产生新知识的泛化也是。一段有助于实现理解目标的信息有很高的价值。拼图中缺失的一块会带来极高的奖励。一旦理解了文章中晦涩难懂的关键单词,整段长篇文本就会从错综复杂的句子变成清晰的推理。

通过泛化证实一个模型,或为一个更好的新模型构建基础,都会让人感觉很棒。此外,所有与强烈的情绪相关联的模型证实都会令人狂喜:「我的团队是世界上最好的! 」,或者**「是的!我刚出生的孩子真的很健康! 」,或者「是的!我知道努力工作会让我获得晋升! 」**。然而,在讨论学习内驱力时,我想过滤掉额外的情感层,因为它可能会使整个局面变得难以理解。我们需要记住:学习是愉快的,这与是否能从运用知识中获得回报无关。

产生新发现时的啊哈!、**哇!尤里卡!**是学习中最纯粹的终极奖励。我们不需要别人的称赞或表扬作为进一步的奖励。在这里,知识本身就是奖励。

这种奖励的共同特征是:都会将新的高价值信息编码进记忆中。

学习内驱力的奖励来自已准备好进入长期记忆的高价值知识

在我们对理解现实的探求中,大脑中存储的信息总量在增加,存储的知识的熵却在下降。凭借学习和建模,理解世界的复杂性会越来越省力。

学习内驱力的演变

科学家说,聪明的动物玩得更多。我要说,更有趣的是,玩得更多的物种更聪明。我推测**学习内驱力可能是人类脑容量爆发增长的触发因素**。这并不是说,鸟类或哺乳动物面临的环境变化需要更多的思考。这并不是说,如果大脑皮层面积不迅速扩张,人类就会突然面临灭绝。而是,可能正是学习内驱力的出现突然让代价高昂的脑细胞数量增加得到了更好的利用。在学习内驱力出现之前,增加脑容量只会让动物头部更重,还得喂养这些额外的细胞。如果没有学习内驱力,这些额外的脑容量可能一直不会被利用,导致浪费性的萎缩。如果学校教育试图凌驾于学习内驱力之上,只会使得这种进化优势被废弃,进而使得整个社会更不聪明、更缺乏创造力。

如果画出人类进化的时间线上的脑容量大小的变化曲线,就会看到大约 200 万年前,曲线有一个强有力的上升。古人类学家倾向于将之归因于饮食的变化,如烹饪方式等,从而更好地为大脑提供了营养。

如果关于学习内驱力出现的假设是正确的,能人很有可能是突破的起点。这可能表明,从简单的鸟类和哺乳动物的程式性行为驱动转变为更复杂的陈述性学习驱动,最终使我们可以建立现实的抽象模型,这是人类智力的基础。还有推测认为,正是能人阶段,由大脑成长主导的童年(从断奶到平均7岁)开始出现。

学习内驱力的出现较晚,这表明它不是神经网络中出现的一个简单属性(参见:Biederman 模型)。否则,它可能很容易出现在鱼或更早的生物上。学习内驱力需要一套专门的神经结构,以便在检测到对陈述性知识的连贯结构的增量贡献时发送奖励信号。这种信号和内在结构在程序性学习和陈述性学习中可能有所不同。对于不同类别的感觉输入,它也可能有所不同。

程序性学习的奖励

早在 20 世纪 80 年代,我就推测可能存在进行程序性学习的大脑回路。在我的硕士论文中,出于无知,我使用了自创术语随机学习。我不知道早在 20 年前,也就是 1969 年,David Marr 已提出了符合我自己想法的小脑皮层理论模型。进入新千年以来,有大量数据可以证实该模型

关于程序性学习的大脑回路的想法非常简单。想象一下你骑自行车的情形。你运用你的意识来学习骑上自行车所需的各个动作,然后持续踩踏板。然而,一旦你上路了,程序性学习系统会确保你能以最小的神经努力自动执行所有动作,无需有意识的监督或仅需对一组命令神经元进行最低限度的监督。程序性学习将决定你的运动程序。该程序性学习系统会对发送到你的运动系统的信号序列进行微小的随机调整(因此我将之命名为**「随机学习 」**),可以将这些随机更改视为程序创意。每当你的自行车失去平衡时,错误检测网络将发送一个惩罚信号,以取消更改。该惩罚信号是运动程序的教学信号。

在睡眠期间,记忆将被重组,以消除有意识的输入,简化、优化,去除对技能几乎没有贡献的垃圾信号。每一次循环,都通过试错法来完善信号序列。每一次睡眠,都会使大脑皮层褶皱变得更光滑。骑自行车将变得令人愉悦。在从笨拙的有意识的骑手到自然而然的骑手的转变中,这种愉悦达到峰值。

类似地,随着在电脑上输入更多句子,你的打字错误会逐渐减少。你知道键盘上的「)」在哪里吗?「}」呢?你打字越流利,就越有可能忘记这些细节。拿掉对运动序列的有意识控制后,键盘上「)」位置的陈述性知识可能会被当作「垃圾」扔掉:你不再需要它了。

陈述性学习的奖励

陈述性学习内驱力的解释会稍微复杂一些。陈述式学习有一个明确的奖励。有些事情很有趣,找出真相令人愉悦。在神经层面,大脑将扫描输入和神经活动,寻找与当前记忆状态相匹配的最大限度提供新知识的高学习熵区域。任何有意义的低概率信息都会被认为更有吸引力。明亮的分形图案是美丽的。灰色的随机色块是乏味的。更复杂的视觉信号也是同样的情况。生机勃勃的森林是美丽的。同样的森林在冬天、旱灾时或在环境污染的影响下可能就没有吸引力。Steven Pinker 说,我们会被有活力的图像所吸引。我不同意这一点。我们会被吸引的范围要大得多。我们同样可能会被一座死火山或南极洲的冰冻景观所吸引。我们喜欢可以使用简单模型来表达复杂信息的环境、信号、消息或大脑活动。一幅美丽的海滩图片可以用几个简单的形状和纹理来表示。

信息熵与数据的可压缩性有关。信号处理过程从输入开始。视网膜对视觉输入信号进行 100 倍压缩。视觉皮层接收形状和关系的简单表示。海马体不定时地接收这些信息。这些信号最终可能会改变新皮层长期记忆存储中单个突触的状态。

学习内驱力的基础是寻找在神经网络中表示知识的有效途径。学习内驱力睡眠中的记忆优化遗忘对于最大化可压缩性、抽象程度可应用性和性能是至关重要的。通过这些,大脑确保我们可以使用简单的表征去看一个复杂的世界。这是人类智力的核心。如果人工智能研究人员能够给机器人配备类似人类的学习内驱力,只要有充足的内存,它们的学习能力就可能是无穷无尽的。

学习中的奖励中枢

2014 年,研究人员报告称,在「高度好奇」的状态下,伏隔核的活动增加了。他们还证明了我们一直都知道的:这种状态改善了记忆表现。此外,提高的表现溢出到了附带学习,即本身不会引起好奇心的学习。这项研究被媒体广泛报道,却是以错误的解释:「好奇心促使大脑拥有更好的记忆力」。例如,《科学美国人》用了这样的标题:《神经影像学揭示了大脑的奖励和记忆路径如何引导探究知识的头脑》。这篇论文本身就暗示了「激发好奇心」的必要性。

由于奖励中枢会涉及到对快乐的预期,我们更应该将这项研究的结果视为证实学习内驱力与快乐相关的一个指标。正是学习内驱力使人学习。正是学习令人愉快。上述标题应该是《神经影像学证实有效的学习令人愉快》。换句话说,顺序不是「开车->享受->学习」,而是「开车->学习->享受」。

与其说需要「激发好奇心」,不如说需要「发展学习内驱力」。关键的不同之处在于,将刺激视为可能在课堂上使用的速效方法,而不是需要几个月甚至几年的长期过程。广告宣传可能会用廉价的花招来激发我们的好奇心,而毕生的热情则是永不满足永不消退的学习内驱力的准则,是不断学习的完美保证。

诚然,好奇心的状态会提高注意力,而这会改善整体的学习。然而,这永远不该被用作教学策略。只有当奖励来自对目标的学习,而不是来自围绕目标的学习时,学习的游戏化才有意义。许多儿童学习项目使用鲜艳的色彩、不寻常的声音或笑脸来吸引孩子的注意力,诱导其学习。然而,一旦成为习惯,这种形式或人工游戏化就不再有效。此外,附带知识也不会持久。任何利用好奇心去激发附带学习的努力,都是不具体且低效的。同样地,我们可能寄望药物干预,例如利他林,可以改善学习。相反,学习必须是它自己的奖励。

伏隔核和腹侧被盖区参与快乐、对快乐的预期和对信号的评估。来自知识估值网络的信号,在其动机和情感的反应中,都汇聚到这些领域。多巴胺与对快乐的预期有关。由于多巴胺与注意力有关,单是对快乐的预期就能改善学习,因为更好地关注了预期会带来快乐的信息来源。

如果你没被说服,想想当你的新闻频道耍花招激起你的兴趣后说「广告后回来」时,你有多讨厌他们。当他们用「突发新闻」毁了这一切时,你会更加恼火。期待也可能导致挫折感。只有真正的学习会提供奖励。从进化论的观点来看,只有真正的学习的奖励才有意义。我们不想仅仅因为看到食物就奖励动物。

伏隔核中的嗡嗡声可能是愉悦的直接表达,也可能是在暗示追求愉悦的状态。归根结底,实际的解释对最终结论并不重要:无聊和不愉快是学习的敌人

为了有效地学习,使新知识与现有知识相辅相成,我们需要遵循学习内驱力。简而言之,这意味着在教育中,学习的乐趣是值得追求的。我们永远不应该在不愉快的状态下学习(参见:合意困难)。痛苦的学习来自大脑使学生知道,在信息论意义上,新知识并不适用!它将被舍弃。快乐是一个很好的向导!

从上述的神经推理中,我们得出了一个显而易见的结论:有效学习的最好保证是让学生自主学习,跟随自己的激情。

Biederman 模型

阅读「阅读的乐趣」的乐趣

2006 年, Irving Biederman 和 Edward A. Vessel 发表了一篇论文,阅读这篇论文给了我令人难忘的乐趣。这篇文章本身向我解释了阅读的乐趣。在一篇题为《知觉的愉悦与大脑》的论文中,Biederman 假设,大脑结构中负责视觉感知的一系列梯度的阿片受体可能会使人在观看美好场景(如美丽的风景)时产生愉悦感。Biederman 的想法似乎解释了我多年以来一直知道的:学习是愉快的。我一直喜欢学习,然而,我从来没有真正从脑科学的角度理解过是什么构成了我的这份喜欢的基础。Biederman 的解释恰到好处,令我非常愉悦。它解释了一些困扰我很长时间的事情。在阅读时,我充分地自我分析。在阅读「阅读的乐趣」时,我试图「感受」阅读的启迪是如何提供这种乐趣的。阅读「阅读的乐趣」的乐趣变得令人难忘。

Biederman 和 Vessel 提出的观点有重大意义。因此,为了简单起见,我现将他们的观点命名为Biederman 模型(按资历取名)。在视觉感知中,一连串神经元层负责视觉场景的更抽象的表示。比喻地说,它从像素和颜色开始,然后转移到边缘、纹理和表面,然后转移到物体,然后转移到面孔、地点和集合,然后转移到有意义的场景片段,在链条的末端,可能会激活一座「美丽的山峰」的表示,并以此被记住,只有少数细节越过了工作记忆的第一印象,被长久记住。数百万像素的照片变成了一个有意义的场景,只需几句话就可以表达出来,并被记住很多年,而这花费的神经成本却很小。

Biederman 模型使用了一项之前的发现(Michael E. Lewis 等人,1981):沿着视觉感知通道存在一系列梯度的mu-阿片受体。神经元承载的含义越多,它可能拥有的阿片受体就越多。我们知道鸦片类药物是有益的,而且会让人上瘾。Biederman 模型基于这样的假设,即这一系列梯度的阿片受体是人能感知到快乐的来源

用于处理语音和音乐的是与之类似的分层系统。颞叶皮质参与处理声音的音调乃至旋律。对节奏的处理还涉及大脑的其他区域。很有可能,所有这些感知网络都遵循相似的原则。这是神经美学的研究课题。

阿片 vs. 多巴胺快感

不过,Biederman 模型有一个小问题。学习的乐趣可以有意识地分析出来。就我自己而言,阅读Biederman 模型的乐趣可以分解并追溯到模型的各个组成部分。这一事实意味着快乐是与有意识的体验相结合的。对于神经科学来说,意识是出了名的难解之谜。我们对意识的大部分了解要么是推测,要么是基于艰难而昂贵的实验,在这些实验中,植入大脑的电极会引起一些反应,这些反应由受影响的个人在随后或同时报告。证据似乎集中在意识的综合模型上,在这种模型中,大脑中几个结构的激活被整合起来,并被感知为有意识的自我。按照这种思路,激活大脑皮层某处的 Halle Berry 神经元并不足以让 Halle 出现在一个人的意识当中。数以百万计的概念神经元可以同时被激活,而正在思考的大脑只能对感知到的现实的少数几个模型进行操作(参见:注意力)。要想使 Halle 出现在一个人的意识中,这种激活必须与意识感知的其他组成部分相结合,包括感知的奖励。

出于这些原因,大脑皮层神经元中的阿片受体不会对学习的最终奖励起到多大作用。一种阿片类拮抗剂,纳洛酮,会剥夺某些人部分听音乐的乐趣。然而,学习的阿片类愉悦应该会产生一种类似于首次使用微剂量海洛因或吗啡时的和缓的快乐。从这个意义上说,内吗啡素的释放和阿片受体的激活有助于学习的快乐。然而,这种快乐还不够具体,不足以让人惊叹「哇!」、「啊哈!」或者「尤里卡」(Biederman 称之为「恍然大悟式的理解」)。对于最终的学习奖励,必须有来自大脑的愉悦中枢的综合奖励体验。

联想的乐趣

发现的终极快乐来自于有意义的联想。这可以用理解 Biederman 模型本身的快乐来解释。在思考这个模型时,我们在脑海中激活了两个重要的概念:(1) 意义的梯度(源于对涉及视觉感知的神经结构的理解)和 (2) 愉悦的梯度(源于对视觉通道中阿片受体含量的观察)。一旦这两个概念出现在脑海中,就会出现类比的粘合:「梯度」的概念。这种粘合有助于产生这样的联想意义=快乐!这是一种令人愉悦的启迪。这正是我在阅读 Biederman 的论文时所感受到的。要产生这种惊叹,仅仅有更多的阿片受体与「愉悦的梯度」这一概念联系在一起是不够的,就算这比阿片受体与梯度的数学基础或它与「梯度」这个词的联系更多。仅仅有更多的阿片受体与「意义的梯度」这一新奇概念联系在一起是不够的,就算这比阿片受体与常用术语「意义」的联系更多。当「意义 + 快乐」这两个有价值的概念发生碰撞时,才会让人产生惊叹。

Biederman 注意到,受体的梯度深入到了联想区,包括旁海马皮质。我们可能还记得,正是在更下游的海马体,我们发现了 Halle Berry 神经元。为了说明阿片类的快乐和联想的快乐之间的区别,让我们想象一下在美丽的海滩上与 Halle 相遇的情景。当走在海滩上时,我们可能会体验到一股微妙的海洛因般的极乐微风,这来自于我们意识到所处环境非常美丽:「我所在的海滩感觉很棒」。一旦 Halle 出现在地平线上,视觉分析可能会提供另一股阿片类的快感,这来自这样的信号:「美丽的女士正在接近」。然后,视觉处理单元可能会把该女士识别为 Halle,这可能会激活 Halle 的皮层表示,这可能是富含阿片的。然而,只有 Halle 和「我的海滩」的终极联系才会引起重大发现,或许是返祖繁殖的梦想:「Halle 和我走在同一片沙滩上!」。这就是来自腹侧纹状体和伏隔核的奖励在「喜欢」这种情况中可能发挥作用的环节,而一点多巴胺可能会触发「想要」的行为程序。由于审查制度,这个「想要」的行为程序的细节已经从这篇文章中删掉了。然而,在高度发达的个体中,该程序的执行将不可避免地被来自其前额叶皮质的执行信号制止。简而言之,在大脑的愉悦中枢注射多巴胺可能会给大脑带来一些不雅的想法,而阿片肽的释放可能只会带来联想上的快乐。

学习的乐趣不一定要包括吸引人的异性代表。Halle 出现在我的例子中只是因为 Halle 神经元的发现。要想获得学习的乐趣,所需要的只是想法之间强大而高价值的联想,这种联想要可以激活大脑的愉悦中枢。每当我们学到新的东西时,快乐就会产生,当我们学到一些有价值的东西时,这种惊叹是最强烈的。发现 Biederman 模型的快乐来自于我的知识估值网络对学习的乐趣本身的高估值。高估值带来高回报,这会促进记忆(参见:多巴胺可能调节学习的可塑性)。

记忆对学习乐趣的影响

我还想补充 Biederman 关于脱敏的假设,即反复接触会导致获得的快感减少。Biederman 认为,孩子们喜欢重复性的电子游戏是因为赌博因素。然而,对于成年人,赌博的威力也并未减小。我假设孩子们更喜欢重复学习,是因为童年失忆症。一些重复的快乐可能来自有限的理解,另一些可以简单地通过加速遗忘来解释。理解能力差和健忘是成人大脑和儿童大脑的主要区别。

我们还应该注意到,复习时快乐的大幅下降不是由于竞争性学习,而是由于长期记忆巩固,这可能导致信号在系统中高效流动。竞争性学习在模式识别中可能很重要,但在联想学习中,高可提取性会削弱重复接触带来的快乐。

学习内驱力进化的阶段

当我假设在人类身上出现了强大的学习内驱力时,我脑海中想的是从知识到奖励中枢的直接渠道。这最终将是比 Biederman 模型所暗示的更高水平的学习内驱力。每次涉及受体时,进化都有一种简单而感恩的材料可用。受体梯度最初是在猕猴的大脑皮质中发现的。类似的机制可能关系到更简单的大脑,甚至是更原始的失去中枢控制的神经系统。我不知道蚂蚁在想什么,也不知道它有什么感受;但找到一个好的食物来源,肯定是某种蚂蚁乐趣的来源。由此我们可以得出结论,从演化史角度来说,学习的乐趣可能并不比神经系统本身年轻多少。然而,在演变的过程中,这种驱动力建立了新的功能和效率层。似乎只有哺乳动物和一些鸟类具备玩耍的创造力。这个进化过程的最终顶点可能就是人类的学习内驱力。自然,在某一时刻,这会应用在在思想机器中。了解学习内驱力的力量将对人类的生存至关重要:无论是在其对人工智能的需求方面,还是在使人工智能成为反对人类的威胁方面。

合意困难

「合意困难」这一概念可能会成为容忍在校学习不快的借口。在这里,我会解释为什么这个借口是不公正且危险的。

Robert Bjork 可能是学习理论方面最好的专家。如果他告诉你在学习中困难是值得的,你会如何想?事实上他是对的,这与「好的学习总是令人愉快」这一事实并不矛盾。合意困难是一群概念的集合体。在这些概念中,学习障碍会促使进一步学习。让我们结合学习的乐趣,将之逐一击破:

  • 主动回忆:主动回忆的效果优于被动复习。主动回忆更难。这是一个合意困难。我们在学习中需要主动回忆,因为这是唯一可以在间隔重复中有效地重新巩固记忆印迹的过程。每当我们在实践中运用知识时,便是在主动回忆。这种运用是令人愉快的,因为它可以提高生产力,这是一种独立于学习之外的奖励。人类单纯地喜欢实现目标。如果复习是人为计划的,就像在 SuperMemo 中一样,它不会产生富有成效的行为,而且很容易失去吸引力。所有成功的 SuperMemo 用户都会把复习与他们的目标联系起来。他们将每一个条目和每一次重复都视为通向更美好未来的一步。然而,并不是所有的用户都有这样的想象力。这就是为什么 SuperMemo 效率惊人,却并没有使人类为之倾倒的原因。

  • 间隔重复:记忆的可提取性更低时,记忆巩固更有效。这也可能导致回忆更困难。这是一个合意困难。与主动回忆一样,复习的奖励来自于知识的使用和生产力。在默认情况下,SuperMemo 中大多数复习能够被成功回忆。难度和快乐之间可能是存在某种联系。同样,只有一小部分用户会发现这个过程是令人愉快的。除他们之外的人通常不会坚持很久便会选择退出。我们告诉所有用户,要让 SuperMemo 变得有趣,否则它不会对你起作用!另见:[知道的乐趣](

  • 渐进复习:SuperMemo 提倡按间隔分散学习。从记忆力和创造力的角度来看,在较长的时间把文章分解成各个小部分来阅读会更有效率。同样的道理也适用于看视频或听讲座。这会产生上下文回顾的问题,但这是次要的。不过,它也在创造性阐述方面带来了额外的好处。它还改进了记忆编码、泛化和长期记忆巩固。矛盾的是,这些额外的困难会产生额外的学习效率,使得渐进阅读成为最令人愉快的学习形式之一。

  • 学习情境:在回忆提取时更改上下文是一种非常简单有效的合意困难。如果编码正确,提取就会成功,这样更有效,有价值。如果语境变化产生了泛化,优化了记忆编码,学习的有效性就会增加,学习的奖励也会增加。

  • 解决问题:解决问题可以是非常愉快的。问题越难,找到解决方案的快乐就越大。解决问题涉及一个学习过程,因为解决问题需要中间步骤:把新知识存储在记忆中。所有这些步骤都是令人愉快的。如果学生在任务中挣扎,长时间没有进展,他就学不到任何东西,也得不到任何奖励。这只能说明这些任务太难了。如果学生没能解决问题,但还是通过中间步骤取得了进展,即使这些步骤没有通向最终的解决方案,他们在此期间也进行了一定的学习,得到了一定的奖励。同样,如果困难是可取的,它将带来奖励。如果不存在奖励,则表明困难是无法逾越的。这种情况下,困难没有意义也不值得追求。

  • 从做中学:「从做中学」可能包括玩耍、创意、解决问题等。完成这些任务需要更多的时间,往往也可以带来更好的结果和更多的奖励。

  • 延迟反馈:延迟反馈在某些情况下需要更多的时间来处理。简而言之,如果老师不告诉你你做得有多好,你可能会好奇一段时间。这其实有利于记忆。如果真是这样的话,最终的效果将是值得的。

  • 收回帮助:我在「学校压制学习内驱力」中写了关于「收回帮助」的内容。没有得到答案的孩子可能会因此变得好奇。好奇心会增加了学习的奖励。在纠正错误的现实模型方面没有得到帮助的学生,会因为靠自己解决不一致而获得更高的奖励。

  • 其他困难:可以改善学习的障碍是无穷无尽的,其中一些可能是因为荷尔蒙的本质,一些可能涉及激励力量。所有这些障碍的共同点似乎是某种形式的更深层次的处理、记忆巩固和改善注意力等等。促使更好学习的障碍也不可避免地要涉及到更好的奖励。

合意困难不会剥夺学习的乐趣。恰恰相反,它使学习更有效、更有趣。如果难度过高,令人不悦,那么困难就不再可取了。这个简单的等价来自于学习内驱力的奖励系统的机制。

请注意,由于合意困难而获得的有效学习的额外奖励不需要与高学习熵相对应。学习熵是信息通道的度量标准。例如,主动回忆与新颖性无关。它指的是记忆重新巩固。同样,解决问题的部分原因可能来自于实现与学习无关的目标的需要,或者是被获得新知识以外的生产力所激励。

还要注意的是,几乎所有上述合意困难都内在地交织在渐进学习的过程中。

对学习上瘾

生而成瘾

我们生来就热爱学习。在强制学校教育的那些年里这种热爱通常很快便会消失。我们对学习的热爱持续越久,对大脑、健康和人类的益处就越大。对学习的热爱与上瘾无关。上瘾的定义包括强制参与某项活动而产生的不良后果。

与益处相比,学习的负面副作用是微乎其微的。一定程度的求知欲,甚至冲动,可以进一步促进积极的影响。提高一个人的学习热情是可能的。好的学习是进一步学习的最好的助推器。

学习与赌博

学习和赌博所涉及的奖励系统之间有着密切的联系。赌博和学习新单词都会以类似的方式激活腹侧纹状体。这种与赌博的密切联系可能会混淆学习的图景。老虎机上的赌徒学不到多少东西。令人上瘾的电子游戏更好一点。它可以很有教育意义。许多团队游戏成瘾者以前在学校没有取得任何进步,但却能流利地说一口流利的英语。对体育新闻的上瘾也可能涉及到一定程度的学习。我是在非洲国家杯期间才了解到卡奔达的。对 Facebook 更新的上瘾也没有什么不同。它基于预期特定收益的可变奖励,然而,它也可能涉及到很大程度的学习。这种学习可能包括八卦、名人新闻、假新闻或实际有用的学习。即使是政治民调更新也会导致上瘾。在希拉里·克林顿和唐纳德·特朗普之间的竞选较量中,民调足够平衡,足以产生扣人心弦的效果。对新民调的强制检查有上瘾的全部特征。然而,这种上瘾可能会带来大量的学习。把赌博和学习分开有赖于学生自己。贪婪的学习是好事。上瘾带来的学习也可能是好的。然而,赌博本身给人类生存带来的价值微乎其微。因此,理解奖励多样性在预防成瘾中的作用非常重要。

学习与睡眠

强迫性学习可能会侵占睡眠时间,并可能导致失眠和 DSPS 的流行。拥有强大学习内驱力的有创造力的头脑可能会熬夜学习到凌晨。在电灯到来之前,这种对于睡眠模式的违反是困难的,甚至是不可能的。好消息是,学习内驱力会随着网络疲劳而衰落。我们学习的时间越长,记忆回路的饱和程度就越高。只有睡觉能带来缓解。因此,即使是最贪婪的学习者也会在某些时候变得昏昏欲睡并放弃学习。如果读者因为看小说而通宵,这可能是由于睡眠动力不足,学习减少,以及悬疑小说中典型的可变奖励增加的组合。

学习与运动

我听说过度学习会导致运动减少。那是很糟糕的。然而,我认为不好的学习更有可能产生这种效果。好的学习是快乐的,会激发额外的能量。一个快乐的孩子不应该长时间坐在书前或电脑前。一定有办法发泄能量。也许我们应该说,运动减少是学习成瘾的标志,而良好的学习有神经营养作用,可以让人产生额外的能量以供消耗?

学习的限制

学习有其代价,而且需要时间。因此学习应该是明智的。然而,好的学习几乎总是一项很好的长期投资。因此我们永远不应该害怕学习上瘾。恰恰相反,我们应该珍惜和推动学习内驱力,为快乐的终身学习做准备。

学习的不悦

当我声称「所有的学习都是令人愉快的」时,我听到了各种的声音,比如「我必须通过一场压力极大的考试,这让我获得了很多终身的好知识」。这些声音混淆了良好学习带来的快乐和将学习变成许多学生的噩梦的因素带来的不快。这些可怕的因素包括糟糕的老师、苛刻的家长、截止日期、压力、糟糕的睡眠、糟糕的课本、过多的课本等等。

我听说,如果没有最后期限或学校强加的目标,学习将被电子游戏、小说、电视、业余爱好、运动等所取代。出于许多原因,这可能是对的。这些活动中的某些可能会给人带来学习之外的乐趣。然而,它们也有学习或锻炼方面的益处。一个全面发展的学生会自由地放慢学习进度,把时间分配给有趣的学习或是其他有趣的活动。「慢慢来」可能会带来更多的益处。

在学习的等式中,良好的学习不可能会产生不快乐。真正的罪魁祸首永远在别处。所有的负面因素都应该加以研究,并消除。

归根结底,即使存在与考试、证书、职责相关的不愉快,这种不愉快也应该由学生自愿强加给自己。

愉快的学习可能会被淹没在压力、坏人、学校、烂教材等共同造成的不愉快中

学习和拖延

如果学习是最可持续的快乐形式,那么为什么半数学生会拖延呢?这几乎是全体人口的三分之一。

答案很简单也很重要:学生拖延是因为好的学习有多么令人快乐,坏的学习就有多么令人不快。学校甚至大学的大多数作业都与学习内驱力的需要相当不匹配。这样的学习即无效,又令人不快。这些孩子经常在晚上玩电脑游戏,理由是他们需要让大脑得到休息。我怀疑他们玩游戏时大脑并没有得到休息。他们实际上是在做他们认为令人愉快的工作。这种快乐很大程度上来自于学习新东西。不幸的是,学校里没有给游戏玩得好分配学分,所以家务和娱乐的正弦循环在第二天甚至是家庭作业的同一天就开始了。

我一直对有那么多学生称自己懒惰感到惊讶。同时,他们可以在体力劳动和脑力劳动方面做到许多艰苦卓绝的壮举,只要这些是令人愉快的或为他们自己的目标服务的。即使是那些在 SuperMemo 中记住了数千条目的人,也经常给自己打出很低的责任心分数。学习的目标可能是模糊的,但即使它们是明确的,输入和已有知识之间的不匹配也会导致严重的不快。如果学习熵较低,任务可能会很无聊。如果学习熵是负的,任务将令人厌恶。

高目标估值和不良学习的奖励负值之间的斗争将导致拖延。拖延者经常称自己懒惰,即使他们决不是懒惰的人。

如果你认为你懒得学习,你需要重新评估手上的学习材料,以及学习方法。即使是稍稍违反自然创造力周期,也会扼杀学习的乐趣。

学习和抑郁

学习带来的快乐,不仅可持续,而且不会让人上瘾。甚至几乎没有副作用,只是需要花时间。此外,好的学习往往令人全神贯注,并能提高学习内驱力,来激发更多的学习。这意味着,用学习治疗抑郁,并非无稽之谈。

在学校学习

如果学习是快乐和奖励的源泉,为什么我们会在学龄儿童中看到抑郁泛滥?尽管学校是学习机构,但更有可能导致抑郁,而不是充当救赎。没有学习的自由,就很难有好的学习。为了让学习变得愉快,它需要由学习内驱力推动。它不能是强制性的或胁迫性的,它必须是自由的。

记忆对情绪的影响

自由学习很有趣,不过,学习能成为应对抑郁的良方,靠的不是乐趣。

记忆是一个可能引发或抑制抑郁的因素。记忆决定了输入信号在大脑中的传导方式。记忆决定了哪些概念与输入或神经激活有关。记忆决定了我们对汽车经过声音的反应。它可能会唤起愉快假期的回忆,对埃隆·马斯克的灵感的回忆,或者是一场导致所爱之人残废的车祸的回忆。

要让记忆对情绪产生重大影响,我们需要很多记忆。仅仅坐下来与心理治疗师会谈并了解一些关于大脑、生活或应对策略的关键事实是不够的。使大脑步入健康的轨迹需要数月甚至数年的学习。我们可能建立起固有的乐观或悲观的联想。我们需要数以千计的这样的联结来改变平衡。然而,即使是多年的学习也可能很容易被病理或创伤所颠覆。神经激素可以立即改变大脑的工作模式。神经激素水平的改变会立即使一组可能对情绪产生负面影响的记忆取得优势地位。创伤可以植入记忆,触发新的激活源,以覆盖其他的激活源。换句话说,如果大脑切换了正在运行的轨道,或者产生了一个新的激活源,那么好的记忆可能会变得毫无价值。用学习去缓和关系密切的人的死亡带来的痛苦是几乎不可能的。

一旦抑郁症发作,受影响的人将面临双重打击。不仅是好的记忆在竭力抵御。不好的记忆开始在周围盘旋,加强它们自己的新轨迹,并占据了上风。大脑对自己重新进行编程,使情绪的平衡朝着错误的方向倾斜。当这个过程变得失控时,我们可能就会面临临床抑郁症。更糟糕的是,抑郁症患者失去了对生活和对学习的热爱。

学习会打乱这个循环吗?这可能是非常困难的!尊重昼夜节律周期是恢复脱轨受扰的大脑的第一步。在昼夜节律周期中,需要捕捉创造力的峰值窗口来尝试治疗性学习。学习需要多产、专注、有效和愉快。渐进阅读如果不是那么困难的话就太棒了。对于一个在该领域没有技能的抑郁症患者来说,SuperMemo 不是一剂良药。已经太迟了。试图在糟糕的心理状态下掌握渐进阅读只会让事情变得更糟。这可能会导致对渐进阅读的厌恶。

如果可以学习,它将起到避难所的作用,这可能有助于抑制负面记忆,建立新的联系。从那时起,构建新知识卷须的过程就开始了。这个应该可以让我们的头脑对世界做出更乐观解释的过程是缓慢而艰苦的。在大多数严重的情况下,可能需要几个月或几年的艰苦工作,且结果无法保证。

最终的结论是,学习不是万能的,但它可以在治疗中发挥重要作用。最重要的是,通过丰富而有效的学习,患抑郁症的风险可以提前几年避免。学习必须在自由和尊重学习内驱力的条件下进行。简而言之,热爱学习是通向热爱生活的好方法。

抗抑郁药

我是医学上的勒德分子(即反对新技术的人)。为了身体的健康,我坚持「如果它没有坏,就不要修理它」的规则。我避免所有形式的药物干预。我相信自稳态的力量,干预自稳态会带来危险。我用的最烈的药是咖啡和啤酒。我甚至不用阿司匹林。最令我沮丧的是滥用抗生素、止痛药、安眠药和抗抑郁药。我距离上次服用抗生素已经有几十年了。时间长得足以忘记。如果有必要,我会在临终床上用一把。所有药物都有其合法用途,抗抑郁药也是如此。因为它们导致受体下调,一旦服用,就会使神经递质状况变得更糟。这通常意味着,服用该药物越多,就需要服用越多以免受挫。然而,在严重的临床抑郁症病例中,药物可能会阻止失控的过程。它们可能会保护大脑免受自我伤害。一旦抑郁症患者开始失去脑细胞,康复之路就会变得漫长而坎坷。抗抑郁治疗如果有效的话,其开始的那一刻是把学习当作治疗方式的最佳时机。只要大脑愿意继续,学习就可以启动那些微妙的知识卷须,这些卷须会与现实挂钩,产生痕量学习内驱力。在理想的情况下,停药后,学习内驱力应该会存活下来,开启逆抑郁过程:学习的正反馈、创造力、良好的睡眠和良好的情绪。这并不容易,但非常重要。如果药物治疗是唯一能改变患者生活的事情,那么它只会作为病理过程的突破口发挥作用。它不会使大脑处于比问题开始之前更好的状态。改进需要积极努力。没有健康的学习内驱力,就不会开始建立积极的记忆。

学习内驱力和乐观

蹒跚学步的孩子的学习内驱力似乎最旺盛。难怪健康的孩子天生乐观。乐观与学习内驱力之间存在关联。在神经化学的基础上,快乐的心灵可能充当着学习内驱力的能量源。悲观肯定会起到抑制或过滤的作用,阻止学习内驱力的表达。从这个意义上说,悲观的心态可能会掩盖学习内驱力。在抑郁时,学习内驱力可能会完全消失。难怪 Robert Sapolsky 博士称抑郁症是世界上最糟的疾病。

似乎出现了一种共识,认为学校是青少年(以及在后来的生活中)抑郁的主要成因。机制尚不清楚,但习得性无助和抑制学习内驱力可能是致病的关键。

学习可以帮助你吗?

如果你正在读这篇文章,但不确定学习能不能帮到你,那就问问自己这个问题:**你今天心情好吗?**如上所述,当你渐入低迷并寻找解决方案时,你的解读会更加阴暗,你可能会觉得这篇文章不够令人安慰。记住激活能量的概念:你需要迈出一小步才能开始,然后你就可能会被一大堆有趣的东西所吸引。

如果你今天没心情学习量子力学,那就从琐碎的名人新闻或体育新闻开始吧。学习一点总比完全不学好!或者,如果琐事让你更加沮丧,请读一读这篇 Susan Engel 写的关于学习和抑郁的有趣文章

教育优化:全局还是局部?

把快乐当做教育的指路灯有风险吗?

“完美”的教育模型

在漫长的学校教育中,我们慢慢形成了一个完美的学术学习过程的想象模型,在这个模型中,我们设置长期目标,追随课程,掌握重要知识,并达到这样的地步:我们获得了大学学历,在特定领域拥有坚如磐石的知识,并学到了在社会中有效协作所需的广泛常识。我们在学校系统待的时间越长,就越难退一步,对这种模式产生客观的看法。矛盾的是,对于那些在学校表现出色并开始相信自己已经成功的人来说,验证这一模式反而是最困难的,这要归功于这种完美的学术学习模式。聪明人在学校遭受的痛苦较少,因此,他们对学校系统的问题考虑得较少。成功的学生会将这种模式内化,并通过为子孙后代提供相同的固定路径来使其永久化。

我们通过课程设计学生知识的模式是错误的!「完美学校」模式把功劳放在系统和老师身上,而所有实际的学习都应该归功于学生。当孩子们成批地失败时,我们往往会责怪孩子或他们的父母,而一小部分成功的学生会继续梦想自己的孩子享有完美学校模式,并不断将这种模式推广到不幸的人身上。

基于学习内驱力的优化

与课程不同的是,学习内驱力背后的优化机制在人类进化过程中已经得到了完善。它能够推动个人知识达到解开科学或工程的所有复杂性所需的水平。在强制学校教育到来之前,人类已经实现了开始启蒙运动工业革命所需的所有可以想象的突破。强制学校教育原本是要帮助“未开明”的群众提升到一个新的高度,但却越来越多地将自己推向了以压制创造性思维取代启蒙的最优化角落。

设计孩子的心智

我一直从受过高等教育和非常聪明的人那里听到这样的话:教育太重要了,不能让它依赖于自学或盲目的学习内驱力。显然,教育是如此重要,我们应该用最好的科学工具和最好的专家在全球范围内规划和设计它。当我全神贯注于高效学习时,在我真正开始思考教育系统之前,我也怀着同样的信念生活。默认听从专家意见是很自然的。

受过高等教育的人经常会说这样的话:

  • 儿童无长远规划能力,因此需要为其设置课程

  • 学习内驱力是一种局部优化,而我们需要的是全局规划教育

  • 追随学生的兴趣是灾难的秘诀:他们最终都会沉浸在麻痹大脑的电子游戏

问题是,教育的全局优化中,设定的绩效目标正在变得越来越严格。全局优化一直在使用同样低效的学习工具,却想要把更多「必要」的知识装入学生的头脑中。对数百万学生来说,结果是悲惨的。虽然斯大林的全局优化使苏联实现了巨大成就,但却是市场经济以其简单的优化算法将西方世界提升到了新的高度。参见:现代学校教育就像苏联经济

目前采用的教育优化以知识测验作为学生表现的衡量标准,但这使得学生依靠死记硬背和短期记忆在较短的时间内取得更高的成绩。结果,它不断失去对学习内驱力的控制。国家之间的竞争也采用表现测试。我们不是针对实际的长期知识进行优化,而是针对学生头脑中的知识周转速度进行优化。其结果是,学生们不高兴,他们学到的知识相对于投入的时间和实际的人类潜力来说微不足道。

依靠涌现

教育优化可以运用涌现这一概念。学习内驱力是知识自组织的一种机制,它不需要老师的努力,也不需要孩子的痛苦。自然的学习可能需要很长时间,但它是令人愉快的。健康的孩子不介意整天学习,只要这是他们自己选择的学习。

有关基于学习内驱力的学习的局部优化,我们应该牢记两个重要事实:

  • 不依靠学习内驱力,就没有好的学习。所有凌驾其上的尝试都会被人类记忆大量拒绝

  • 学习内驱力为学习过程带来了令人惊叹的高效长期优化。人类在 1850s 之前的几乎所有成就都是在学习内驱力的指导下完成的

怀疑论者会注意到,自从引入强制学校教育以来,人类进步加快了。他可能是对的。然而,自从 40 亿年前第一批生命出现以来,我们就一直在加速进步(译者按:可参考「加速回归定律」)。我认为 Guttenberg 和 Tim Berners-Lee 比可敬的 Johann Julius Hecker 对这种加速的贡献更大。

基于学习内驱力的局部优化非常不直观。创世论科学来自于对自然选择机制的一种类似的非直觉感受。基于随机变异的局部进化优化怎么会给一个人带来奇迹呢?来自上帝之手的全局设计/优化/指导似乎是不可避免的。如今,相信创世论科学的人越来越少,然而,绝大多数人不知道学习内驱力背后的机制是什么,为什么忽视了它是普鲁士教育系统的主要问题。

树木生长比喻

如果有足够的时间和机会进入知识丰富的环境,不需要教育系统,个人的知识就会成长为一个庞大、全面且连贯的知识体。所有自由、健康的个人都是如此。这棵树的大小和质量可能取决于一个人的个性、兴趣和智力发展的起点。然而,教育的一个主要误区是,知识的有机增长导致了多重偏见和被忽视的区域。据称,这些盲点比接受多年教育后留下的盲点要大。由于学习内驱力的计算能力,和涌现现象,情况正好相反。我喜欢的一个解释学习内驱力力量的比喻,是树木的生长。

比喻。为什么使用比喻?

人类个人知识的自然生长可以比作一棵树的生长。树枝分生组织中的单个细胞对这棵树及其总体生长目标知之甚少。分生组织遵循简单的激素、生化或生物物理规则(如顶端优势)。那些引导植物向光生长的简单规则是高效的,树可以漂亮地塑造树冠。它还可以与其他物种有效地组织成一个树冠。重力是处理问题的最佳方法。营养物质的重新分配很容易。对光的吸收极佳。所有障碍物,例如其他树木、岩石或灯柱,都很容易处理。类似的机制确保了植物根系的有效生长。大脑中的生长锥萌发新的神经连接时也采用了一套简单的局部规则。

知识之树遵循相似的原则工作。学习内驱力机制确保每一片记忆的叶子都渴望新发现的曙光,并朝着灵感的方向发芽。局部而言,学习内驱力可能看起来简单而盲目。在全局范围内,我们成长为拥有支持社会中所有重要人类功能所需的博学知识的伟大个体。自学的大脑可以适应任何环境,可以实现所有可以想象到的人类目标。

正如树木需要水、二氧化碳、一些营养物质和光线一样,大脑也需要能量、丰富的投入和不受约束的自由。所有强制监管的尝试都会抑制学习内驱力,令知识之树无法自行发芽生长

另一个有助于解释在建立连贯知识的过程中的涌现现象的比喻是知识结晶比喻

Crystallization metaphor of schooling and unschooling

图:完美的学校教育中,我们创造了完美的知识结晶。在大学,我们增加了额外的专业知识结晶。然而在现实中,学习看起来并不那么完美。对于大多数孩子来说,知识永远无法建立足够的连贯性,并且由于知识干扰(即快速遗忘)而分崩离析。因此,在真正的学校教育中,知识逐渐达到一定的数量,并从那时起一直在不停地翻滚,却在稳定性连贯性上几乎没有进步。相比之下,在自由学习中,知识的获取是混乱和不均衡的。但是,只要是基于学习内驱力,所获取的知识总量是非常庞大的。知识的单个晶体相互碰撞,形成一致性连贯性。这反过来又有助于稳定性和知识的进一步整合。到了大学时,就数量而言,自由学习者应该比普通学生知道的要多得多。自由知识有多个强项,也有多个弱项。然而,它在连贯性方面更具优势;因此它在问题解决中更适用

局部优化

学习内驱力的局部优化使得人的能力与个人的环境和目标之间实现了完美匹配(参阅:学习内驱力的优化)。试图从全局层面优化学校教育抑制了学习内驱力,在将个人与他们的工作相匹配时遵从被压抑的学习内驱力,并产生了一个不愉快的社会,在这个社会中,大多数人渴望朝九晚五的舒适工作,而领导力、学习和责任都被委派给其他人。民主学校的情况则相反,它依靠自学培养出自我决定、自我实现和自力更生的人,做好准备去接受他们所选择的兴趣领域的任何挑战。

在史蒂夫 · 乔布斯历史性的毕业典礼演讲中,他开玩笑说,在被诊断出癌症之前,他不知道胰腺是什么。显然,他盲目的学习内驱力,让他丰富的知识缺了一块。即使这是真的,我也绝不会用史蒂夫 · 乔布斯和他的毕生杰作,来换取几次失败的局部优化学习。他鼓舞人心的演讲的要点之一,就是跟随自己的学习内驱力。用他的话说,「成就大事的唯一途径,就是热爱自己在做的事」。数百年来,没有智者不会讲述这条真理。

全局优化可能实现吗?

全局优化为所有输入寻找最优方案。学习的全局优化是在教育部门级别进行的,例如,通过共同核心标准标准化测试等工具。作为全局优化基础的是一个有缺陷的推理:我们可以设计一个孩子的大脑。试图预测孩子未来的父母也会进行全局优化。

我们能提前决定孩子的未来吗?如果让父母在全局范围内选择最优的未来,律师和医生会过量。失意的大学辍学者也会过量。如果政府提供一点帮助,在孩子很小的时候最优地分配工作,我们最终会得到 1984 的一种变种。很少有孩子愿意在 6 岁时发现自己未来注定当簿记员或木匠。工作的选择显然应该基于爱和激情,而不是政府命令。

那么,也许应该允许孩子们在全局范围内进行优化?这也行不通,最终摇滚音乐家、专业电子游戏玩家和足球运动员会过剩。

这与通过学习内驱力进行的优化形成了对比,后者几个世纪以来提供了人类最好的成就。

那么课程就是在通向全局最优的道路上试图找到一个中间最优。用课程去指导什么是值得了解的似乎是一个好主意。当孩子或老师对学习缺乏热情时,他们可以参考课程。不过,如果学习内驱力已经在超速运转,就不必放慢速度。孩子可能永远也学不会酒精的危害吗?不太可能。另一方面,我不知道有什么课程会教孩子们如何使用渐进阅读。我可能有偏见,但我肯定会把这项技能放在死记硬背 Kawalec 或采迪尼战役(取自我自己的课程)的要求之前。如今,我很欣赏已故的 Julian Kawalec。然而,当权党当局强制要求我阅读他的小说,是我在学校遭受折磨的一个来源。你可能想知道 Kawalec 是谁。我很乐意告诉你,但维基百科上已经有一篇关于他的成就的文章了(只有波兰语版)。

如果你对照课程测试学生的知识,很容易发现他们仅仅掌握了全局优化计划的一小部分。此外,他们通过自学获得了大量关于这个世界的其他知识。这导致了「学校教育是好的」的错觉。如果课程不是义务的,教师有更多的改编空间,知识量及其连贯性都会增加。连贯性和速度是自学的两个标志。更少的孩子可能会选择解二次方程,但他们会用大量其他他们认为重要的技能来填满这一空白。所有那些计划以 STEM 为职业生涯的人迟早会学到二次方程。其他的人则会回到当前的默认状态,即学习公式然后很快忘记它们。大多数人不知道如何解二次方程。很少有人知道二次方程的目的。课程中的方程式增加了痛苦和知识的成本,而这些知识本可以是大脑在快乐的状态下伺机有效获得的。

如果不可能实现全局的长期优化,那么课程计划形式的中间步骤就不那么复杂了。但它们仍然偏离了学习内驱力所决定的最优状态。

有效优化的唯一方法是让学习内驱力确定发展轨迹,辅以父母、导师、同龄人、陌生人、社交媒体、维基百科、谷歌等的温和推动。优化教育必须遵循**学习的基本规律**(接下来说明)。

学习的基本规律

大多数人都知道学习可以是快乐的。然而,很少有人意识到这一事实对教育的未来有多么重要。

只有神经科学中源源不断的宝贵发现才能帮助我们认识到学习乐趣的根本重要性。奖励过程从感知层面开始,通过联想学习,到创造力,乃至问题解决,直至实现目标的最终快乐。在每个中间阶段都有奖励智力活动进展的快乐信号。

我也迟迟不能理解快乐的力量。在 1991 年,我们曾保守地写道:「有一种确定的方法可以判断一个学生是否会在工作中取得成功。如果他在长期的学习过程中找到了乐趣,他肯定会做得非常好」(参见:SuperMemo 十诫)。今天,我们意识到快乐与神经网络中所有形式的学习是如此内在地联系在一起,以至于它成为衡量学习进展的最佳标准之一。

这使得阐述陈述性学习的基本规律成为可能:

没有快乐,就没有好的学习。

当然,这个规律需要被证明是准确的。好的陈述性学习会带来快乐。这一事实可能会被一些因素所掩盖,例如,一些好的学习会隐藏在大量的毒性学习之中。快乐本身并不是学习的保证。我们发现的事实可能令人忧心。一些陈述性学习可能发生在不愉快的条件下(例如在条件化恐惧下)。经典的条件反射常常伴随着疼痛。临床抑郁症会阻碍一个人骑自行车的倾向,但不会破坏骑自行车时发生的程序性学习。

陈述性学习的基本规律只是简单地说明了,获得满足学习内驱力的高质量知识将产生奖励信号。没有这个信号就表明缺乏学习。枯燥的事实可以毫无乐趣地进入短期的陈述性记忆,但如果没有学习的奖励,这些事实就不会依附于可靠的现实模型。这些事实很可能会被健康的遗忘系统快速地从记忆中消除。更糟糕的是,糟糕且持久的印记可能会入侵未来的人生!记忆中任何连贯的模型的出现,都不可避免会产生奖励信号。

如果你碰巧把痛苦强加给自己,你需要重新考虑你的策略。你可能需要放慢脚步,或者回到基础,学习心智和睡眠科学的规则,管理你的压力,学习 20 条制卡规则,或者可能尝试一下渐进阅读。就算你不顾痛苦地坚持,你也得不到好的结果。格拉德威尔的一万小时法则也需要经过(学习的基本规律的)认证。没有一位小提琴演奏家是仅仅通过数千小时的练习之苦而脱颖而出的。就像学习一样,伟大的音乐是爱的产物。

另一方面,这个世界上的大多数学生都不是苦于自己的过错。糟糕的学习是上面强加给他们的!

**全世界的学生团结起来!**你不再需要忍受学习的痛苦。如果你受苦,你有抗议的基本学生权利。如果你受苦,一定是哪里出错了!你可以停止学习!如果有人要求你学习,你却不喜欢,你可以反击,要求快乐的学习!这不是你精英享乐主义的弱心要求。这是理性的要求。**没有快乐就没有学习!**你的受苦是浪费时间,浪费健康,浪费人类全球资源!见:教育解放宣言

Learn drive vs. School drive

图 :学校就是这样摧毁了对学习的热爱。学习内驱力是孩子愿意去追求的一系列激情和兴趣。学校外驱力是学校系统设置的一套奖励和惩罚措施。学习内驱力帮助形成了简单的、助记的、连贯的稳定的适用的记忆,这是因为知识的质量决定了学习内驱力系统中的奖励程度。由于学校通过课程(而不是通过学习内驱力的神经机制)将知识序列化,学校外驱力导致了学生形成复杂且容易受到干扰的短期记忆。在学习内驱力学校外驱力通路之间的竞争性抑制将导致神经连接的减弱。强大的学校外驱力会削弱学习内驱力,破坏学习的热情,并导致习得性无助。强大的学习内驱力会导致反抗,保护内在的激情,但也可能会让你在学校闯祸。在学习内驱力的影响下,记忆新的知识是非常有意义的,而且没有任何惩罚(根据学习内驱力的定义)。这将使学习内驱力茁壮成长,带来学习上的成功(和在学校)。相反,由学校外驱力的压力导致的知识质量低下将产生较弱的奖励信号,并可能产生强烈的不连贯性惩罚。这种惩罚将反馈产生对学校外驱力反抗,这反过来又需要学校系统的进一步强制纠正,这又会进一步降低知识的质量。这些反馈循环可能会导致学习内驱力和学校外驱力的竞争,并最终压制一方而助长另一方。蓬勃发展的学习内驱力会助长反抗,从而增加对学校外驱力的防卫。同样,在学校增加的惩罚会助长习得性无助,削弱学习内驱力,导致对系统的服从。可悲的是,在大多数情况下,控制系统将定格在这两个极端的中间位置(见:老汤问题)。大多数孩子讨厌学校,失去了对学习的热爱,仍然服从于奴役。他们恢复的最好机会是大学的自由,或者更好的是,成年后的自由。见:在神经元水平上二元决策的竞争性反馈回路

版权说明:你可以在知识共享许可下重新发布这张图片,并注明 SuperMemo World这里查看最新的版本

总结:学习的乐趣

  • 人脑自然会了解环境中的「有趣信息」

  • 学习和发现新事物给人以奖赏感

  • 许多教育工作者认同这个危险的迷思:会引起不快的学习仍然可能有效

  • 获取新知识时,惊喜十分重要

  • 可预测性和惊喜都可能增加信息渠道的吸引力

  • 信息渠道的吸引力取决于前置知识

  • 向大脑传递信息,必须考虑到大脑的前置知识。所以,传授知识(例如通过班级授课)很难适用于所有人

  • 信息渠道的吸引力取决于传递速度和处理速度

  • 学习中信息传授的速度和复杂度必须根据个人需求量身定做

  • 对新的高价值联想记忆进行编码的同时,学习者也在向大脑的奖励中枢传递信号

  • 学校教育中的信息渠道无法实现个性化,因此缺乏奖励

  • 学习提供的快乐是独特而持续的,可能具有治疗效果

  • 由于系统性原因,学校教育通常无法依照儿童的兴趣而开展

  • 学校本质上匮乏奖励,这是学生普遍厌恶学校“学习”的主要原因。

  • 破坏学习的乐趣,也就促成了不愉快的社会

  • 陈述性学习的基本规律是:没有快乐,就没有学习!